Benötigte Packages öffnen

library(tidyverse)
## -- Attaching packages ------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v purrr   0.3.4
## v tibble  3.0.1     v dplyr   1.0.0
## v tidyr   1.1.0     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## -- Conflicts ---------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(ggpubr)
library(reshape2)
## 
## Attaching package: 'reshape2'
## The following object is masked from 'package:tidyr':
## 
##     smiths
library(patchwork)
library(gtools)
library(car)
## Loading required package: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:gtools':
## 
##     logit
## The following object is masked from 'package:dplyr':
## 
##     recode
## The following object is masked from 'package:purrr':
## 
##     some
library(psych)
## 
## Attaching package: 'psych'
## The following object is masked from 'package:car':
## 
##     logit
## The following object is masked from 'package:gtools':
## 
##     logit
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
library(pastecs)
## 
## Attaching package: 'pastecs'
## The following objects are masked from 'package:dplyr':
## 
##     first, last
## The following object is masked from 'package:tidyr':
## 
##     extract
library(rstatix)
## 
## Attaching package: 'rstatix'
## The following object is masked from 'package:stats':
## 
##     filter
library(gridExtra)
## 
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
## 
##     combine
library(data.table)
## 
## Attaching package: 'data.table'
## The following objects are masked from 'package:pastecs':
## 
##     first, last
## The following objects are masked from 'package:reshape2':
## 
##     dcast, melt
## The following objects are masked from 'package:dplyr':
## 
##     between, first, last
## The following object is masked from 'package:purrr':
## 
##     transpose
library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
knitr::opts_chunk$set(include = TRUE, echo = FALSE, warning = FALSE) # Generelle Einstellungen für alle Chunks: include = TRUE (Output anzeigenlassen), echo = TRUE (Codes anzeigen lassen)
options(knitr.kable.NA = '') # damit in der Tabelle NAs als leere Felder angezeigt werden

Einlesen des VAO- und Haushaltsdatensatzes von ÖU 2013/2014

Histogramm Zugangszeiten VAO vs. ÖU 2013/2014

Zunächst werden die Variablen “hh_oev_entf_kat” und “hh_oev_entf_kat_neu” mit folgenden Klassen gebildet.

Klassen: 1…-90, 2…0 min, 3… 1-5 min, 4… 6-15 min, 5… 16-30 min, 6… 31-60 min, 7… 61-120 min, 8… 120-180 min, 9…>180 min)

Zugangszeiten im ÖU 2013/2014-Datensatz mit dem Wert -94, also > 180 min, werden kurzfristig auf 300 gesetzt.

Histogramm Zugangszeiten VAO vs. ÖU 2013/2014 hochgerechnet

Es wird nun das gleiche Histogramm gebildet, allerdings mit den hochgerechneten Werten.

Hochrechnen des Datensatzes

Zunächst werden die beiden Datensätze (VAO und ÖU) zusammmengefügt. Anschließend wird die Hochrechnung durchgeführt. Leider funktionierte die Funktion “weights” nicht, weshalb die Hochrechnung über Umwege erfolgte.

##  [1] "hh_nr"                  "hst_gehdauer"           "hst_gehlaenge"         
##  [4] "hst_vm"                 "hst_zug"                "hst_sbahn"             
##  [7] "hst_ubahn"              "hst_tram"               "hst_bus"               
## [10] "hst_regbus"             "hst_type"               "hst_kategorie"         
## [13] "hst_gehdauer_kat"       "hh_wohnbdl"             "hh_wohnraumtyp"        
## [16] "hh_wohnbezirk"          "hh_wohngemeinde"        "hh_gr"                 
## [19] "hh_gru6"                "hh_gr617"               "hh_grue18"             
## [22] "hgr_kat"                "hh_oev_entf"            "hh_oev_entf_kat"       
## [25] "hh_oev_bus"             "hh_oev_strb"            "hh_oev_ubahn"          
## [28] "hh_oev_bahn"            "hh_carsharing"          "hh_wirtschsituation"   
## [31] "fzg_radges"             "fzg_e_rad"              "fzg_mot"               
## [34] "fzg_pkw"                "hh_hochrechnungsfaktor" "hh_kobasis"            
## [37] "hh_öv_güte"             "hst_gehlänge_"          "hst_gehdauer_"         
## [40] "hh_oev_entf_kat_neu"

Nun wird eine Häufigkeitstabelle erzeugt und geplottet.

Datenaufbereitung

Alle Zugangszeiten > 180 min werden zu -94, um dies an ÖU 2013/2014 anzugleichen. Überall, wo die Zugangszeit auf -94 gesetzt wird, wird auch der Zugangsweg auf -94 gesetzt.

Die ÖU 2013/2014-Zugangszeiten, die vorher auf imaginäre 300 Minuten gesetzt wurden, werden wieder auf -94 gesetzt.

Zwecks Vereinfachung fürs Rechnen werden alle negativen Werte (z.B. nicht anwendbar, keine Haltestelle gefunden, Zugangszeit > 180 min) zu NA umgerechnet, da R fehlende Werte in vielen Fällen automatisch bei Rechnungen ignoriert.

Die Variable “hst_bus” wird zur Variable “hst_lokbus” umgenannt. Danach werden die Variablen “hst_lokbus” und “hst_regbus” zur Variable “hst_bus” sowie die Variablen “hst_zug” und “hst_sbahn” zu “hst_bahn” kombiniert, da im ÖU 2013/2014-Datensatz nicht nach den beiden Bus- bzw. Bahnkategorien unterschieden wurde.

Zugangszeiten von 0 min werden durch 1 min ersetzt: 1) werden dadurch Divisionen ermöglicht. 2) entspricht dies dem Durchschnitt der ermittelten Zugangszeit bei den gleichen Distanzen.

“Nein”-Antworten, die im ÖU 2013/2014-Datensatz mit 2 codiert wurden, werden zu 0 codiert und so an den VAO-Datensatz angepasst.

Häufigkeiten der Zugangszeiten

Es werden nun die Zugangszeiten in einem Liniendiagramm dargestellt, um Unterschiede zwischen den ermittelten und angegebenen Zugangszeiten feststellen zu können.

Häufigkeit der angegebenen/ermittelten Zugangszeiten pro Minute

Und nun mit kumulierten Häufigkeiten

Kombinieren von VAO-, OeU_HH-Datensatz und Urban-Rural-Typologie

Nicht benötigte bzw. doppelte Variablen werden in dem kombinierten Datensatz (“Vergleich”) ausgeblendet.

##  [1] "hh_nr"                  "hst_gehdauer"           "hst_gehlaenge"         
##  [4] "hst_vm"                 "hst_zug"                "hst_sbahn"             
##  [7] "hst_ubahn"              "hst_tram"               "hst_lokbus"            
## [10] "hst_regbus"             "hst_type"               "hst_kategorie"         
## [13] "hst_gehdauer_kat"       "hst_bus"                "hst_bahn"              
## [16] "hh_wohnbdl"             "hh_wohnraumtyp"         "hh_wohnbezirk"         
## [19] "hh_wohngemeinde"        "hh_gr"                  "hh_gru6"               
## [22] "hh_gr617"               "hh_grue18"              "hgr_kat"               
## [25] "hh_oev_entf"            "hh_oev_entf_kat"        "hh_oev_bus"            
## [28] "hh_oev_strb"            "hh_oev_ubahn"           "hh_oev_bahn"           
## [31] "hh_carsharing"          "hh_wirtschsituation"    "fzg_radges"            
## [34] "fzg_e_rad"              "fzg_mot"                "fzg_pkw"               
## [37] "hh_hochrechnungsfaktor" "hh_kobasis"             "hh_öv_güte"            
## [40] "hst_gehlänge_"          "hst_gehdauer_"          "hh_oev_entf_kat_neu"
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   101.0   101.0   103.0   227.7   410.0   430.0

Klassifizieren der Daten

Die Klassifizierung ist für die statistische Auswertung erforderlich.

Übereinstimmung der Zugangszeiten

Um die Übereinstimmung der Zugangszeiten feststellen zu können, wird einerseits ein sogenannter Übereinstimmungsfaktor eingeführt, andererseits werden die Zuganszeiten in einem Punktdiagramm dargestellt.

Übereinstimmungfaktor

Für Vergleiche zwischen den Zugangszeiten der beiden Datensätze wird ein sogenannter Übereinstimmungsfaktor eingeführt. Dabei wird die ÖU 2013/2014-Zugangszeit durch die VAO-Zugangszeit dividiert. Ein Übereinstimmungsfaktor zwischen 0 und kleiner 1 bedeutet, dass die in ÖU 2013/2014 angegebene Zugangszeit die ermittelte Zugangszeit unterschätzt. Ein Übereinstimmungsfaktor von genau 1 bedeutet, dass die Zugangszeiten ident sind und alle Werte größer 1 bedeuten, dass die in ÖU 2013/2014 angegebene Zugangszeit die ermittelte Zugangszeit überschätzt. Jene Werte können zwischen > 1 und unendlich liegen. Da aufgrund dieser Asymmetrie direkte Vergleiche kaum möglich sind, wird in den Diagrammen eine logarithmische Skala herangezogen. Der Übereinstimmungsfaktor ist folgendermaßen zu interpretieren: - Übereinstimmungsfaktor < 1: Zugangszeit ÖU 2013/2014 < VAO (Zugangszeit wird unterschätzt) - Übereinstimmungsfaktor = 1: Zugangszeiten sind ident - Übereinstimmungsfaktor > 1: Zugangszeit ÖU 2013/2014 > VAO (Zugangszeit wird überschätzt)

Zusätzlich zu dem Übereinstimmungsfaktor wird der logarithmierte Übereinstimmungsfaktor angegeben (lg10 (Zugangszeit ÖU/Zugangszeit VAO)). Dieser ist folgendermaßen zu interpretieren:

  • Übereinstimmungsfaktor < 0: Zugangszeit ÖU 2013/2014 < VAO (Zugangszeit wird unterschätzt)
  • Übereinstimmungsfaktor = 0: Zugangszeiten sind ident
  • Übereinstimmungsfaktor > 0: Zugangszeit ÖU 2013/2014 > VAO (Zugangszeit wird überschätzt)

Tabelle erzeugen (Interpretation des Übereinstimmungsfaktors)

Übereinstimmungsgrad Zugangszeit Interpretation
2 < 1 (< 0 bei lg) ÖU 2013/2014 < VAO Unterschätzen der Zugangszeit
3 = 1 (= 0 bei lg) ÖU 2013/2014 = VAO Idente Zugangszeit
4 > 1 (> 0 bei lg) ÖU 2013/2014 > VAO Überschätzen der Zugangszeit

Berechnen des Übereinstimmungsfaktors

Zusätzlich wird der Übereinstimmungsfaktor in fünf Klassen eingeteilt, die die Kenntnis, also den Grad der Übereinstimmung beschreiben. Dazu wird der nicht logarithmisierte Übereinstimmungfaktor herangezogen. Es ergeben sich folgende Klassen:

  1. sehr gute Kenntnis: 0,90 ≤ gleich_entf_fakt < 1,12
  2. gute Kenntnis: 0,70 ≤ gleich_entf_fakt < 0,90 und 1,12 ≤ gleich_entf_fakt < 1,43
  3. mäßige Kenntnis: 0,50 ≤ gleich_entf_fakt < 0,70 und 1,43 ≤ gleich_entf_fakt < 2,01
  4. schlechte Kenntnis: 0,30 ≤ gleich_entf_fakt < 0,50 und 2,01 ≤ gleich_entf_fakt < 3,31
  5. sehr schlechte Kenntnis: gleich_entf_fakt < 0,30 und gleich_entf_fakt ≥ 3,31

Tabelle erzeugen (Interpretation der Farben des Übereinstimmungsfaktors)

Übereinstimmungsgrad Kenntnis Farbzuordnung Farbe
2 < 0,3 bzw. ≥ 3,31 Sehr schlecht Dunkelrot
3 0,30 bis < 0,50 bzw. 2,01 bis < 3,31 Schlecht Hellrot
4 0,50 bis < 0,70 bzw. 1,43 bis < 2,01 Mäßig Orange
5 0,70 bis < 0,90 bzw. 1,12 bis < 1,43 Gut Hellgrün
6 0,90 bis < 1,12 Sehr gut Dunkelgrün

Punktdiagramm

Auf der x-Achse befindet sich die ÖU 2013/2014-Zugangszeit, auf der y-Achse die VAO-Zugangszeit. Der Übereinstimmungsgrad (Kenntnis) ist in den zuvor eingeführten Kategorien farblich dargestellt. Zusätzlich wird eine durch den Ursprung gehende Regressionsgerade hinzugefügt und die Formel der Regressionsgerade angeführt.

Punktdiagramm: Teilbereich von 15 min

Nun wird der Teilbereich von Zugangszeiten bis 15 min dargestellt. Die Punktansammlungen ergeben sich aufgrund der gewählten Darstellung des Punktdiagramms. Je quadratischer und dünkler ein Bereich, umso mehr Werte befinden sich dort.

Punktdiagramm: Teilbereich von 5 min

Nun wird der Teilbereich von Zugangszeiten bis 15 min dargestellt. Die Punktansammlungen ergeben sich aufgrund der gewählten Darstellung des Punktdiagramms. Je quadratischer und dünkler ein Bereich, umso mehr Werte befinden sich dort.

Untersuchen möglicher Einflussfaktoren auf den Kenntnisstand

In weiterer Folge mittels Hypothesentests geprüft, ob verschiedene Variablen einen Einfluss auf den Übereinstimmungsfaktor haben. Dies wird zudem mittels Boxplots graphisch abgebildet, bei denen die Gruppen der untersuchten Variablen sowie die Summe dieser Gruppen einander gegenüber gestellt werden.

Vorgehensweise bei den Hypothesentests

  1. Bilden von Subsets für jede Gruppe einer Variable
  2. Bilden von je einem Histogramm je Gruppe, um die Normalverteilung zu prüfen (Statistische Tests sind bei großen Stichproben sehr schnell signifikant.)
  3. Testen der Varianzhomogenität mittels Levene-Test.
  4. Bei Normalverteilung und Varianzhomogenität: ANOVA
    • Durchführen der ANOVA mittels “aov()”-Funktion
    • Anzeigen der Ergebnisse der ANOVA mittels “summary()”
  5. Bei Normalverteilung und Varianzheterogenität: Welch-Test
    • Bei 2 Gruppen innerhalb einer Variable: Welch-Test mittels “t.test()”-Funktion
    • Bei > 2 Gruppen innerhalb einer Variable: Welch’s ANOVA mittels “oneway.test()”-Funktion.
  6. Post-hoc-Tests:
    • Bei ANOVA: Paarweiser Vergleich der Ergebnisse der ANOVA mittels “pairwise.t.test()”. Ergebnis ist eine t-Test-Signifikanztabelle. Ist der p-Wert <0,05, so ist die Nullhypothese, dass die beiden verglichenen Gruppen ähnlich sind, zu verwerfen. Es sind zwei Methoden zur Anpassung des p-Werts empfehlenswert: Bonferroni ist am konservativsten, Holm ist auch ok.
    • Bei ANOVA: Histogramm der standardisierten Residuen zur Prüfung der Normalverteilung mittels “hist(rstandard())”-Funktion
    • Bei ANOVA: Q-Q-Plot, um ebenfalls die Normalverteilung zu prüfen
    • Bei Welch’s Test bzw. Welch’s ANOVA: games_howell_test

Beschriftung der y-Achse

Unabhängige Variable: Zugangsweite zur nächstgelegenen Haltestelle laut VAO

Zunächst werden die Labels für die Angabe der Stichprobengröße und des Mittelwerts je Gruppe und für alle Gruppen gemeinsam erzeugt. Anschließend wird ein Subset gebildet und fehlende Werte rausgefiltert. Danach wird geplottet.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     5  45.616 < 2.2e-16 ***
##       16437                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hst_gehlaenge_kat
## F = 477.13, num df = 5.000, denom df = 92.584, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 15 x 8
##    .y.           group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
##  * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
##  1 gleich_entf_~ 1      2       -0.217    -0.236   -0.199  3.66e- 8 ****        
##  2 gleich_entf_~ 1      3       -0.319    -0.348   -0.290  0.       ****        
##  3 gleich_entf_~ 1      4       -0.412    -0.456   -0.367  5.75e-11 ****        
##  4 gleich_entf_~ 1      5       -0.605    -0.741   -0.468  2.99e-10 ****        
##  5 gleich_entf_~ 1      6       -1.36     -2.13    -0.595  1.00e- 3 ***         
##  6 gleich_entf_~ 2      3       -0.102    -0.134   -0.0696 0.       ****        
##  7 gleich_entf_~ 2      4       -0.194    -0.240   -0.148  5.02e-10 ****        
##  8 gleich_entf_~ 2      5       -0.387    -0.524   -0.250  4.07e-10 ****        
##  9 gleich_entf_~ 2      6       -1.15     -1.91    -0.378  5.00e- 3 **          
## 10 gleich_entf_~ 3      4       -0.0923   -0.144   -0.0409 5.52e- 6 ****        
## 11 gleich_entf_~ 3      5       -0.285    -0.424   -0.146  6.30e- 7 ****        
## 12 gleich_entf_~ 3      6       -1.04     -1.81    -0.276  8.00e- 3 **          
## 13 gleich_entf_~ 4      5       -0.193    -0.336   -0.0502 2.00e- 3 **          
## 14 gleich_entf_~ 4      6       -0.952    -1.72    -0.184  1.50e- 2 *           
## 15 gleich_entf_~ 5      6       -0.759    -1.53     0.0118 5.40e- 2 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Wohnbundesland hochgerechnet

Zunächst werden die Labels für die Angabe der Stichprobengröße und des Mittelwerts je Gruppe und für alle Gruppen gemeinsam erzeugt. Anschließend wird ein Subset gebildet und fehlende Werte rausgefiltert. Danach wird geplottet.

Hochrechnen des Datensatzes

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##            Df F value    Pr(>F)    
## group       8  2834.7 < 2.2e-16 ***
##       3480288                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_wohnbdl
## F = 6760.7, num df = 8, denom df = 872114, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 36 x 8
##    .y.              group1 group2 estimate conf.low conf.high p.adj p.adj.signif
##  * <chr>            <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
##  1 gleich_entf_fak~ 1      2      -0.110   -0.114    -0.106   0     ****        
##  2 gleich_entf_fak~ 1      3       0.0429   0.0392    0.0465  0     ****        
##  3 gleich_entf_fak~ 1      4      -0.0825  -0.0861   -0.0788  0     ****        
##  4 gleich_entf_fak~ 1      5      -0.0355  -0.0396   -0.0314  0     ****        
##  5 gleich_entf_fak~ 1      6       0.00235 -0.00142   0.00612 0.592 ns          
##  6 gleich_entf_fak~ 1      7      -0.0509  -0.0548   -0.0470  0     ****        
##  7 gleich_entf_fak~ 1      8      -0.0545  -0.0590   -0.0501  0     ****        
##  8 gleich_entf_fak~ 1      9      -0.0209  -0.0244   -0.0174  0     ****        
##  9 gleich_entf_fak~ 2      3       0.153    0.150     0.156   0     ****        
## 10 gleich_entf_fak~ 2      4       0.0275   0.0248    0.0303  0     ****        
## # ... with 26 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Durchschnittliche Zugangsweite pro Wohnbundesland hochgerechnet

## # A tibble: 9 x 2
##   hh_wohnbdl  name
##   <fct>      <dbl>
## 1 1           440.
## 2 2           757.
## 3 3           448.
## 4 4           703.
## 5 5           495.
## 6 6           581.
## 7 7           496.
## 8 8           423.
## 9 9           229.

Unabhängige Variable: Wohnbundesland

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     8   17.98 < 2.2e-16 ***
##       16434                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_wohnbdl
## F = 35.948, num df = 8.0, denom df = 4100.6, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 36 x 8
##    .y.           group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
##  * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
##  1 gleich_entf_~ 1      2      -0.0968   -0.148    -0.0456 1.90e- 7 ****        
##  2 gleich_entf_~ 1      3       0.0670    0.0302    0.104  6.53e- 7 ****        
##  3 gleich_entf_~ 1      4      -0.0632   -0.111    -0.0152 1.00e- 3 ***         
##  4 gleich_entf_~ 1      5      -0.0268   -0.0765    0.0230 7.64e- 1 ns          
##  5 gleich_entf_~ 1      6       0.00989  -0.0279    0.0477 9.97e- 1 ns          
##  6 gleich_entf_~ 1      7      -0.0614   -0.101    -0.0216 6.27e- 5 ****        
##  7 gleich_entf_~ 1      8      -0.0639   -0.118    -0.0101 7.00e- 3 **          
##  8 gleich_entf_~ 1      9      -0.00473  -0.0409    0.0314 1.00e+ 0 ns          
##  9 gleich_entf_~ 2      3       0.164     0.119     0.209  4.44e-13 ****        
## 10 gleich_entf_~ 2      4       0.0336   -0.0206    0.0879 5.96e- 1 ns          
## # ... with 26 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 9 x 2
##   hh_wohnbdl  name
##   <fct>      <dbl>
## 1 1          0.222
## 2 2          0.204
## 3 3          0.301
## 4 4          0.222
## 5 5          0.243
## 6 6          0.252
## 7 7          0.222
## 8 8          0.222
## 9 9          0.301
## [1] 2
## # A tibble: 9 x 2
##   hh_wohnbdl  name
##   <fct>      <dbl>
## 1 1           1.67
## 2 2           1.6 
## 3 3           2   
## 4 4           1.67
## 5 5           1.75
## 6 6           1.79
## 7 7           1.67
## 8 8           1.67
## 9 9           2

Durchschnittliche Zugangsweite pro Wohnbundesland

## # A tibble: 9 x 2
##   hh_wohnbdl  name
##   <fct>      <dbl>
## 1 1           459.
## 2 2           773.
## 3 3           417.
## 4 4           665.
## 5 5           539.
## 6 6           658.
## 7 7           419.
## 8 8           458.
## 9 9           230.
##      name
## 1 476.013

Unabhängige Variable: Wohnraumtyp

Der Wohnraum wurde in 4 Kategorien unterteilt.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     3  50.406 < 2.2e-16 ***
##       16439                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_wohnraumtyp
## F = 26.504, num df = 3.0, denom df = 6372.4, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 6 x 8
##   .y.           group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
## * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
## 1 gleich_entf_~ 1      2      -0.0587  -0.0825    -0.0349   1.55e-8 ****        
## 2 gleich_entf_~ 1      3       0.0159  -0.00427    0.0360   1.79e-1 ns          
## 3 gleich_entf_~ 1      4       0.0113  -0.00780    0.0303   4.26e-1 ns          
## 4 gleich_entf_~ 2      3       0.0746   0.0514     0.0978   1.36e-8 ****        
## 5 gleich_entf_~ 2      4       0.0700   0.0477     0.0923   1.30e-9 ****        
## 6 gleich_entf_~ 3      4      -0.00459 -0.0229     0.0137   9.17e-1 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Urban-Rural-Typologie (hochgerechnet)

Der Wohnraum wurde in 11 Kategorien unterteilt.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##            Df F value    Pr(>F)    
## group      10  3228.7 < 2.2e-16 ***
##       3480611                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and UR_TYP
## F = 2611.1, num df = 10, denom df = 330065, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 55 x 8
##    .y.           group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
##  * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
##  1 gleich_entf_~ 101    102    -0.0215  -0.0242   -0.0189  0.       ****        
##  2 gleich_entf_~ 101    103     0.0700   0.0672    0.0729  0.       ****        
##  3 gleich_entf_~ 101    210     0.0307   0.0265    0.0350  0.       ****        
##  4 gleich_entf_~ 101    220     0.0450   0.0407    0.0494  0.       ****        
##  5 gleich_entf_~ 101    310    -0.00697 -0.00897  -0.00497 2.20e-14 ****        
##  6 gleich_entf_~ 101    320     0.144    0.137     0.152   0.       ****        
##  7 gleich_entf_~ 101    330     0.0972   0.0885    0.106   0.       ****        
##  8 gleich_entf_~ 101    410    -0.0491  -0.0510   -0.0472  0.       ****        
##  9 gleich_entf_~ 101    420    -0.00607 -0.00928  -0.00286 6.05e- 8 ****        
## 10 gleich_entf_~ 101    430    -0.0538  -0.0567   -0.0509  0.       ****        
## # ... with 45 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Urban-Rural-Typologie

Der Wohnraum wurde in 11 Kategorien unterteilt.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group    10  12.731 < 2.2e-16 ***
##       16432                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and UR_TYP
## F = 7.4667, num df = 10.0, denom df = 1880.5, p-value = 9.836e-12
  1. Post-hoc-Tests
## # A tibble: 55 x 8
##    .y.              group1 group2 estimate conf.low conf.high p.adj p.adj.signif
##  * <chr>            <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
##  1 gleich_entf_fak~ 101    102    -0.0111  -6.02e-2  0.0380   1     ns          
##  2 gleich_entf_fak~ 101    103     0.0459   8.30e-3  0.0834   0.004 **          
##  3 gleich_entf_fak~ 101    210     0.0402  -2.10e-2  0.101    0.56  ns          
##  4 gleich_entf_fak~ 101    220     0.0299  -3.08e-2  0.0906   0.885 ns          
##  5 gleich_entf_fak~ 101    310     0.00165 -2.67e-2  0.0300   1     ns          
##  6 gleich_entf_fak~ 101    320     0.131    2.71e-2  0.235    0.003 **          
##  7 gleich_entf_fak~ 101    330     0.107    6.03e-4  0.214    0.047 *           
##  8 gleich_entf_fak~ 101    410    -0.0292  -5.93e-2  0.000809 0.065 ns          
##  9 gleich_entf_fak~ 101    420     0.0350  -7.39e-3  0.0775   0.218 ns          
## 10 gleich_entf_fak~ 101    430    -0.0194  -5.77e-2  0.0189   0.867 ns          
## # ... with 45 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 11 x 2
##    UR_TYP  name
##    <ord>  <dbl>
##  1 101    0.301
##  2 102    0.222
##  3 103    0.301
##  4 210    0.301
##  5 220    0.301
##  6 310    0.222
##  7 320    0.398
##  8 330    0.301
##  9 410    0.222
## 10 420    0.247
## 11 430    0.222
## [1] 2
## # A tibble: 11 x 2
##    UR_TYP  name
##    <ord>  <dbl>
##  1 101     2   
##  2 102     1.67
##  3 103     2   
##  4 210     2   
##  5 220     2   
##  6 310     1.67
##  7 320     2.5 
##  8 330     2   
##  9 410     1.67
## 10 420     1.76
## 11 430     1.67

Unabhängige Variable: Wirtschaftssituation

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     4  2.8165 0.02376 *
##       16328                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_wirtschsituation
## F = 12.895, num df = 4.0, denom df = 1061.7, p-value = 2.962e-10
  1. Post-hoc-Tests
## # A tibble: 10 x 8
##    .y.          group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
##  * <chr>        <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
##  1 gleich_entf~ 1      2        0.0466  -0.0453   0.139     6.32e-1 ns          
##  2 gleich_entf~ 1      3        0.0157  -0.0695   0.101     9.86e-1 ns          
##  3 gleich_entf~ 1      4       -0.0123  -0.0977   0.0730    9.95e-1 ns          
##  4 gleich_entf~ 1      5       -0.0379  -0.126    0.0498    7.57e-1 ns          
##  5 gleich_entf~ 2      3       -0.0309  -0.0694   0.00760   1.83e-1 ns          
##  6 gleich_entf~ 2      4       -0.0589  -0.0977  -0.0201    3.51e-4 ***         
##  7 gleich_entf~ 2      5       -0.0845  -0.128   -0.0407    1.62e-6 ****        
##  8 gleich_entf~ 3      4       -0.0280  -0.0451  -0.0110    6.91e-5 ****        
##  9 gleich_entf~ 3      5       -0.0537  -0.0803  -0.0270    4.19e-7 ****        
## 10 gleich_entf~ 4      5       -0.0256  -0.0527   0.00151   7.50e-2 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 5 x 2
##   hh_wirtschsituation  name
##   <ord>               <dbl>
## 1 1                   0.222
## 2 2                   0.301
## 3 3                   0.301
## 4 4                   0.243
## 5 5                   0.222
## [1] 2
## # A tibble: 5 x 2
##   hh_wirtschsituation  name
##   <ord>               <dbl>
## 1 1                    1.67
## 2 2                    2   
## 3 3                    2   
## 4 4                    1.75
## 5 5                    1.67

Unabhängige Variable: Datenbasis für Koordinaten

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     5  8.4681 5.145e-08 ***
##       16437                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_kobasis
## F = 6.2137, num df = 5.000, denom df = 83.588, p-value = 6.032e-05
  1. Post-hoc-Tests
## # A tibble: 15 x 8
##    .y.            group1 group2 estimate conf.low conf.high   p.adj p.adj.signif
##  * <chr>          <chr>  <chr>     <dbl>    <dbl>     <dbl>   <dbl> <chr>       
##  1 gleich_entf_f~ 1      2        0.0324  0.0108     0.0540 2.86e-4 ***         
##  2 gleich_entf_f~ 1      3       -0.0152 -0.0727     0.0423 9.74e-1 ns          
##  3 gleich_entf_f~ 1      4       -0.135  -0.756      0.486  9.77e-1 ns          
##  4 gleich_entf_f~ 1      5        0.257   0.00551    0.509  4.30e-2 *           
##  5 gleich_entf_f~ 1      6       -0.119  -0.353      0.116  6.68e-1 ns          
##  6 gleich_entf_f~ 2      3       -0.0476 -0.108      0.0125 2.10e-1 ns          
##  7 gleich_entf_f~ 2      4       -0.167  -0.788      0.454  9.45e-1 ns          
##  8 gleich_entf_f~ 2      5        0.225  -0.0273     0.477  9.90e-2 ns          
##  9 gleich_entf_f~ 2      6       -0.151  -0.386      0.0844 4.14e-1 ns          
## 10 gleich_entf_f~ 3      4       -0.120  -0.742      0.503  9.87e-1 ns          
## 11 gleich_entf_f~ 3      5        0.272   0.0159     0.529  3.30e-2 *           
## 12 gleich_entf_f~ 3      6       -0.103  -0.344      0.137  8.01e-1 ns          
## 13 gleich_entf_f~ 4      5        0.392  -0.258      1.04   4.29e-1 ns          
## 14 gleich_entf_f~ 4      6        0.0162 -0.632      0.664  1.00e+0 ns          
## 15 gleich_entf_f~ 5      6       -0.376  -0.708     -0.0429 1.80e-2 *

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: ÖV-Güteklasse

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     6  8.8634 1.128e-09 ***
##       13742                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hh_öv_güte
## F = 3.4591, num df = 6.0, denom df = 5988.5, p-value = 0.002055
  1. Post-hoc-Tests
## # A tibble: 21 x 8
##    .y.              group1 group2 estimate conf.low conf.high p.adj p.adj.signif
##  * <chr>            <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
##  1 gleich_entf_fak~ A      B       0.0272  -1.89e-3    0.0563 0.085 ns          
##  2 gleich_entf_fak~ A      C       0.0352   3.09e-3    0.0672 0.021 *           
##  3 gleich_entf_fak~ A      D       0.0366   5.03e-3    0.0682 0.011 *           
##  4 gleich_entf_fak~ A      E       0.0324  -7.72e-4    0.0655 0.061 ns          
##  5 gleich_entf_fak~ A      F       0.0422   1.02e-2    0.0741 0.002 **          
##  6 gleich_entf_fak~ A      G       0.0323   1.82e-3    0.0628 0.03  *           
##  7 gleich_entf_fak~ B      C       0.00797 -2.32e-2    0.0392 0.989 ns          
##  8 gleich_entf_fak~ B      D       0.00943 -2.13e-2    0.0402 0.972 ns          
##  9 gleich_entf_fak~ B      E       0.00516 -2.71e-2    0.0374 0.999 ns          
## 10 gleich_entf_fak~ B      F       0.0150  -1.61e-2    0.0461 0.79  ns          
## # ... with 11 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Haltestellenkategorie (ÖROK)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     7  12.216 1.164e-15 ***
##       13376                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and hst_kategorie
## F = 10.372, num df = 7.0, denom df = 3407.8, p-value = 6.113e-13
  1. Post-hoc-Tests
## # A tibble: 28 x 8
##    .y.           group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
##  * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
##  1 gleich_entf_~ I      II       0.0602  7.48e-4    0.120  4.50e- 2 *           
##  2 gleich_entf_~ I      III      0.0908  3.68e-2    0.145  1.27e- 5 ****        
##  3 gleich_entf_~ I      IV       0.0705  1.52e-2    0.126  3.00e- 3 **          
##  4 gleich_entf_~ I      V        0.0807  2.57e-2    0.136  2.65e- 4 ***         
##  5 gleich_entf_~ I      VI       0.0639  7.79e-3    0.120  1.30e- 2 *           
##  6 gleich_entf_~ I      VII      0.0904  3.62e-2    0.145  1.57e- 5 ****        
##  7 gleich_entf_~ I      VIII     0.141   8.15e-2    0.201  3.12e-10 ****        
##  8 gleich_entf_~ II     III      0.0306 -6.02e-3    0.0673 1.81e- 1 ns          
##  9 gleich_entf_~ II     IV       0.0102 -2.82e-2    0.0486 9.93e- 1 ns          
## 10 gleich_entf_~ II     V        0.0204 -1.76e-2    0.0584 7.31e- 1 ns          
## # ... with 18 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: U-Bahnhaltestelle laut VAO-Datensatz

Fährt an der nächstgelegenen Haltestelle eine U-Bahn weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  1.3011  0.254
##       16441
  1. Hypothesentests
##                Df Sum Sq Mean Sq F value   Pr(>F)    
## hst_ubahn       1    5.1   5.081   38.18 6.62e-10 ***
## Residuals   16441 2188.0   0.133                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 627 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$hst_ubahn 
## 
##   0      
## 1 6.6e-10
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_ubahn  name
##   <fct>     <dbl>
## 1 0         0.301
## 2 1         0.111
## [1] 2
## # A tibble: 2 x 2
##   hst_ubahn  name
##   <fct>     <dbl>
## 1 0          2   
## 2 1          1.29

Unabhängige Variable: Straßenbahnhaltestelle laut VAO-Datensatz

Fährt an der nächstgelegenen Haltestelle eine Straßenbahn weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value   Pr(>F)    
## group     1  53.067 3.37e-13 ***
##       16441                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by hst_tram
## t = 6.9296, df = 2049.2, p-value = 5.632e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.04081871 0.07304213
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2956331       0.2387027
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.            group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
## * <chr>          <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
## 1 gleich_entf_f~ 0      1       -0.0569  -0.0730   -0.0408 6.07e-11 ****

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_tram  name
##   <fct>    <dbl>
## 1 0        0.301
## 2 1        0.222
## [1] 2
## # A tibble: 2 x 2
##   hst_tram  name
##   <fct>    <dbl>
## 1 0         2   
## 2 1         1.67

Unabhängige Variable: Bushaltestelle

Fährt an der nächstgelegenen Haltestelle ein Bus weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  0.0618 0.8036
##       16441
  1. Hypothesentests
##                Df Sum Sq Mean Sq F value Pr(>F)
## hst_bus         1      0 0.03341    0.25  0.617
## Residuals   16441   2193 0.13339               
## 627 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$hst_bus 
## 
##   0   
## 1 0.62
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_bus  name
##   <fct>   <dbl>
## 1 0       0.243
## 2 1       0.301
## [1] 2
## # A tibble: 2 x 2
##   hst_bus  name
##   <fct>   <dbl>
## 1 0        1.75
## 2 1        2

Unabhängige Variable: Lokalbushaltestelle

Fährt an der nächstgelegenen Haltestelle ein Lokalbus weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     1  42.607 6.887e-11 ***
##       16441                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by hst_lokbus
## t = -0.14159, df = 12645, p-value = 0.8874
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.01210543  0.01047444
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2900529       0.2908684
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1      0.000815  -0.0105    0.0121 0.887 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_lokbus  name
##        <int> <dbl>
## 1          0 0.243
## 2          1 0.301
## [1] 2
## # A tibble: 2 x 2
##   hst_lokbus  name
##        <int> <dbl>
## 1          0  1.75
## 2          1  2

Unabhängige Variable: Regionalbushaltestelle

Fährt an der nächstgelegenen Haltestelle ein Regionalbus weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value   Pr(>F)    
## group     1  23.383 1.34e-06 ***
##       16441                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by hst_regbus
## t = 1.556, df = 11382, p-value = 0.1197
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.00237894  0.02069353
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2965379       0.2873806
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1      -0.00916  -0.0207   0.00238  0.12 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_regbus  name
##        <int> <dbl>
## 1          0 0.301
## 2          1 0.243
## [1] 2
## # A tibble: 2 x 2
##   hst_regbus  name
##        <int> <dbl>
## 1          0  2   
## 2          1  1.75

Unabhängige Variable: Bahnhaltestelle

Fährt an der nächstgelegenen Haltestelle eine Eisenbahn weg? Ja (1)/Nein (0)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value   Pr(>F)    
## group     1  38.629 5.25e-10 ***
##       16441                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by hst_bahn
## t = 11.038, df = 814.72, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.1071581 0.1535122
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2960280       0.1656929
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1        -0.130   -0.154    -0.107     0 ****

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   hst_bahn  name
##      <dbl> <dbl>
## 1        0 0.301
## 2        1 0.176
## [1] 2
## # A tibble: 2 x 2
##   hst_bahn  name
##      <dbl> <dbl>
## 1        0   2  
## 2        1   1.5

Einlesen des Personendatensatzes von ÖU 2013/2014

##  [1] "hh_nr"                    "pers_nr"                 
##  [3] "hh_wohnbdl"               "hh_wohnraumtyp"          
##  [5] "pers_alter"               "pers_alter_kat"          
##  [7] "pers_geschlecht"          "pers_bildung"            
##  [9] "pers_beruf"               "pers_arbeitsstd"         
## [11] "pers_arbeitflex"          "pers_arbeittele"         
## [13] "pers_arbeit_parkpl"       "pers_fs_krad"            
## [15] "pers_fs_pkw"              "pers_fahrrad"            
## [17] "pers_krad"                "pers_pkw"                
## [19] "pers_oev_zeitkarte"       "pers_oev_ermaessigung"   
## [21] "pers_navi_pkw"            "pers_navi_oev"           
## [23] "pers_navi_andere"         "pers_betr_kind"          
## [25] "pers_betr_verwandte"      "pers_betr_andere"        
## [27] "pers_hochrechnungsfaktor"

Datenaufbereitung

Negative Werte werden zu NAs umgewandelt, um besser rechnen zu können.

Negative Werte werden zu NA umgeformt. “Nein”-Antworten, die im ÖU 2013/2014-Datensatz mit 2 codiert wurden, werden zu 0 codiert und so an den VAO-Datensatz angepasst.

Subset bilden für Einpersonenhaushalte

Umrechnen des Personendatensatzes auf Haushaltsebene

Da die Zugangszeiten nur auf Haushaltsebene vorhanden sind, ist der Personendatensatz auf Haushaltsebene umzurechnen. Allerdings ist dies nicht bei allen Variablen sinnvoll. Umrechnung der Arbeitsstunden auf Haushaltsebene funktionierte nicht, da vermutlich zu viele NAs enthalten sind.

## `summarise()` ungrouping output (override with `.groups` argument)

Negative Werte werden zu NAs umgewandelt, um besser rechnen zu können.

Einführen eines ÖV-Nutzungsfaktors nach ÖV-Zeitkartenbesitz

Auf Haushaltsebene: Besitzen alle Personen des Haushalts eine ÖV-Zeitkarte oder nur manche oder niemand? - 0 … niemand besitzt eine ÖV-Zeitkarte - 1 … mindestens eine Person im Haushalt, aber nicht jede besitzt eine ÖV-Zeitkarte - 2 … alle Personen im Haushalt besitzen eine ÖV-Zeitkarte

Klassifizieren der Daten

Die Klassifizierung ist für die statistische Auswertung erforderlich.

## tibble [17,070 x 22] (S3: tbl_df/tbl/data.frame)
##  $ hh_nr                    : Factor w/ 17070 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
##  $ mean_pers_alter          : num [1:17070] 62 40 29 47 44 56 38 64 24 34 ...
##  $ max_pers_bildung         : num [1:17070] 3 4 3 5 4 3 5 5 3 5 ...
##  $ mean_pers_arbeitsstd     : num [1:17070] NA NA NA NA NA NA NA NA NA NA ...
##  $ max_pers_arbeitflex      : num [1:17070] -Inf 1 1 1 0 ...
##  $ max_pers_arbeittele      : num [1:17070] -Inf 0 0 0 0 ...
##  $ max_pers_arbeit_parkpl   : num [1:17070] -Inf 3 3 1 3 ...
##  $ max_pers_fs_krad         : num [1:17070] 0 1 1 0 0 1 0 0 1 1 ...
##  $ max_pers_fs_pkw          : num [1:17070] 1 1 1 1 1 1 1 1 1 1 ...
##  $ max_pers_fahrrad         : num [1:17070] 1 1 1 1 1 ...
##  $ max_pers_krad            : num [1:17070] -Inf 1 1 0 -Inf ...
##  $ max_pers_pkw             : num [1:17070] 3 3 3 3 3 3 3 3 3 3 ...
##  $ max_pers_oev_zeitkarte   : num [1:17070] 0 1 1 1 1 0 1 0 0 0 ...
##  $ max_pers_oev_ermaessigung: num [1:17070] 0 1 1 1 1 0 1 0 0 0 ...
##  $ max_pers_navi_pkw        : num [1:17070] 1 0 1 0 1 1 1 1 1 1 ...
##  $ max_pers_navi_oev        : num [1:17070] 0 1 1 0 1 1 1 0 0 0 ...
##  $ max_pers_navi_andere     : num [1:17070] 0 1 0 0 1 1 1 0 0 1 ...
##  $ max_pers_betr_kind       : num [1:17070] 0 0 0 0 1 0 1 0 0 1 ...
##  $ max_pers_betr_verwandte  : num [1:17070] 0 1 0 0 0 1 0 0 0 0 ...
##  $ max_pers_betr_andere     : num [1:17070] 0 0 0 0 0 0 0 0 0 0 ...
##  $ nutz_oev_zeitkarte       : num [1:17070] 0 1 1 2 1 0 2 0 0 0 ...
##  $ mean_pers_alter_kat      : Factor w/ 8 levels "1","2","3","4",..: 7 5 4 6 5 7 5 7 3 4 ...
## 'data.frame':    17070 obs. of  49 variables:
##  $ hh_nr                 : Factor w/ 17070 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
##  $ hst_gehdauer          : num  4 2 10 1 3 6 1 7 2 1 ...
##  $ hst_gehlaenge         : num  466 156 1040 137 324 699 207 592 170 165 ...
##  $ hst_vm                : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ hst_ubahn             : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ hst_tram              : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 2 1 1 1 ...
##  $ hst_lokbus            : int  0 0 0 0 0 0 0 0 0 1 ...
##  $ hst_regbus            : int  1 1 1 1 1 1 0 1 1 0 ...
##  $ hst_type              : Factor w/ 2 levels "4","5": 1 1 1 1 1 1 1 1 1 1 ...
##  $ hst_kategorie         : Ord.factor w/ 8 levels "I"<"II"<"III"<..: NA 7 NA NA 6 8 3 NA 7 7 ...
##  $ hst_gehdauer_kat      : Factor w/ 9 levels "1","2","3","4",..: 3 3 4 3 3 4 3 4 3 3 ...
##  $ hst_bus               : Factor w/ 2 levels "0","1": 2 2 2 2 2 2 1 2 2 2 ...
##  $ hst_bahn              : num  0 0 0 0 0 0 0 0 0 0 ...
##  $ hh_wohnbdl            : Factor w/ 9 levels "1","2","3","4",..: 6 6 3 3 3 1 9 1 7 2 ...
##  $ hh_wohnraumtyp        : Factor w/ 4 levels "1","2","3","4": 4 4 4 4 3 4 1 4 3 3 ...
##  $ hh_wohnbezirk         : Factor w/ 116 levels "101","103","104",..: 80 71 39 34 42 8 106 3 83 10 ...
##  $ hh_wohngemeinde       : Factor w/ 116 levels "101","103","104",..: 80 71 39 34 42 8 106 3 83 10 ...
##  $ hh_gr                 : int  2 4 4 3 4 2 3 2 4 3 ...
##  $ hh_gru6               : int  0 0 0 0 0 0 0 0 0 1 ...
##  $ hh_gr617              : int  0 1 2 0 0 0 1 0 2 0 ...
##  $ hh_grue18             : int  2 3 2 3 4 2 2 2 2 2 ...
##  $ hgr_kat               : Ord.factor w/ 4 levels "1"<"2"<"3"<"4": 2 4 4 3 4 2 3 2 4 3 ...
##  $ hh_oev_entf           : int  25 3 20 7 7 35 3 6 1 5 ...
##  $ hh_oev_entf_kat       : Ord.factor w/ 6 levels "1"<"2"<"3"<"4"<..: 3 1 3 2 2 4 1 2 1 1 ...
##  $ hh_oev_bus            : Factor w/ 2 levels "0","1": 2 2 2 1 2 2 1 2 2 2 ...
##  $ hh_oev_strb           : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 2 1 1 1 ...
##  $ hh_oev_ubahn          : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ hh_oev_bahn           : Factor w/ 2 levels "0","1": 2 2 1 2 2 1 1 1 1 1 ...
##  $ hh_carsharing         : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ hh_wirtschsituation   : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 3 4 4 4 3 4 4 4 4 4 ...
##  $ fzg_radges            : int  2 3 4 1 4 2 3 1 4 2 ...
##  $ fzg_e_rad             : int  0 NA 0 NA 0 1 0 0 NA 0 ...
##  $ fzg_mot               : int  0 3 1 NA 0 NA 0 0 1 0 ...
##  $ fzg_pkw               : int  1 3 2 2 2 2 1 2 2 2 ...
##  $ hh_hochrechnungsfaktor: num  134.3 163.6 17.9 83.6 358 ...
##  $ hh_kobasis            : Factor w/ 6 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 2 ...
##  $ hh_öv_güte            : Factor w/ 7 levels "A","B","C","D",..: NA 6 NA 5 NA NA 3 NA 6 4 ...
##  $ hh_oev_entf_kat_neu   : Factor w/ 9 levels "1","2","3","4",..: 5 3 5 4 4 6 3 4 3 3 ...
##  $ GKZ_neu               : int  62376 61013 32131 31628 32144 10915 90001 10402 70337 20201 ...
##  $ GEMNAME               : chr  "Bad Radkersburg" "Großklein" "Sieghartskirchen" "Kreuzstetten" ...
##  $ UR_TYP                : Ord.factor w/ 11 levels "101"<"102"<"103"<..: 5 9 6 8 3 10 1 11 1 2 ...
##  $ POP_2015              : int  3092 2260 7245 1545 26463 1000 1797337 1382 2945 60500 ...
##  $ seit                  : chr  "01.01.2015" NA "01.01.2017" "01.01.2017" ...
##  $ gemname_alt           : chr  "Radkersburg Umgebung" "Großklein" "Sieghartskirchen" "Kreuzstetten" ...
##  $ hst_zug               : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
##  $ gleich_entf_fakt      : num  6.25 1.5 2 7 2.33 ...
##  $ gleich_entf_fakt_lg   : num  0.796 0.176 0.301 0.845 0.368 ...
##  $ gleich_entf_kat       : Factor w/ 5 levels "5","4","3","2",..: 1 3 3 1 2 1 2 4 2 1 ...
##  $ hst_gehlaenge_kat     : Ord.factor w/ 6 levels "1"<"2"<"3"<"4"<..: 1 1 3 1 1 2 1 2 1 1 ...

Hinzufügen zum Datensatz “Vergleich”

Die auf Haushaltsebene umgerechneten Personendaten werden an den Datensatz “Vergleich” angehängt.

Untersuchen möglicher Einflussfaktoren auf den Kenntnisstand

Unabhängige Variable: Geschlecht (Einpersonenhaushalte)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value  Pr(>F)  
## group    1    3.63 0.05684 .
##       3225                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests

  2. Post-hoc-Tests

## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_geschlecht 
## 
##   1     
## 2 0.0024
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Durchschnittliche Alterskategorie

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     7  2.5736 0.01193 *
##       16435                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and mean_pers_alter_kat
## F = 55.565, num df = 7.00, denom df = 194.16, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 28 x 8
##    .y.              group1 group2 estimate conf.low conf.high p.adj p.adj.signif
##  * <chr>            <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
##  1 gleich_entf_fak~ 1      2        0.120  -0.142       0.382 0.791 ns          
##  2 gleich_entf_fak~ 1      3        0.171  -0.0681      0.410 0.248 ns          
##  3 gleich_entf_fak~ 1      4        0.202  -0.0357      0.440 0.117 ns          
##  4 gleich_entf_fak~ 1      5        0.234  -0.00436     0.472 0.056 ns          
##  5 gleich_entf_fak~ 1      6        0.261   0.0224      0.499 0.029 *           
##  6 gleich_entf_fak~ 1      7        0.288   0.0496      0.526 0.015 *           
##  7 gleich_entf_fak~ 1      8        0.342   0.104       0.580 0.004 **          
##  8 gleich_entf_fak~ 2      3        0.0514 -0.0964      0.199 0.959 ns          
##  9 gleich_entf_fak~ 2      4        0.0825 -0.0604      0.225 0.618 ns          
## 10 gleich_entf_fak~ 2      5        0.114  -0.0292      0.257 0.218 ns          
## # ... with 18 more rows

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Alterskategorie (Einpersonenhaushalte)

Null Beobachtungen in der Alterskategorie 6-14 Jahre.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    6   1.486 0.1787
##       3220
  1. Hypothesentests

  2. Post-hoc-Tests

## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_alter_kat 
## 
##   2       3       4       5       6       7      
## 3 1.00000 -       -       -       -       -      
## 4 1.00000 0.31359 -       -       -       -      
## 5 1.00000 0.41473 1.00000 -       -       -      
## 6 1.00000 0.03312 1.00000 1.00000 -       -      
## 7 1.00000 0.00039 0.06850 0.07693 0.94338 -      
## 8 0.41406 7.9e-08 9.1e-08 3.4e-07 4.4e-06 0.05573
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Höchste abgeschlossene Ausbildung

Die jeweils höchste Ausbildung von den in einem Haushalt lebenden Personen wird hierfür herangezogen.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     4  5.7309 0.0001321 ***
##       16286                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and max_pers_bildung
## F = 29.693, num df = 4.00, denom df = 513.15, p-value < 2.2e-16
  1. Post-hoc-Tests
## # A tibble: 10 x 8
##    .y.          group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
##  * <chr>        <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
##  1 gleich_entf~ 1      2       0.0764   -0.0548  0.208      4.86e-1 ns          
##  2 gleich_entf~ 1      3       0.0413   -0.0868  0.169      8.95e-1 ns          
##  3 gleich_entf~ 1      4       0.00183  -0.127   0.130      1.00e+0 ns          
##  4 gleich_entf~ 1      5      -0.0215   -0.150   0.107      9.90e-1 ns          
##  5 gleich_entf~ 2      3      -0.0351   -0.0694 -0.000777   4.20e-2 *           
##  6 gleich_entf~ 2      4      -0.0746   -0.111  -0.0386     1.75e-7 ****        
##  7 gleich_entf~ 2      5      -0.0980   -0.133  -0.0632     0.      ****        
##  8 gleich_entf~ 3      4      -0.0395   -0.0601 -0.0190     1.60e-6 ****        
##  9 gleich_entf~ 3      5      -0.0629   -0.0813 -0.0444     0.      ****        
## 10 gleich_entf~ 4      5      -0.0234   -0.0447 -0.00201    2.40e-2 *

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Höchste abgeschlossene Ausbildung (Einpersonenhaushalte)

Die höchste abgeschlossene Ausbildung von in Einpersonenhaushalten lebenden Personen wird hierfür herangezogen.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value  Pr(>F)  
## group    4  2.8829 0.02135 *
##       3171                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and pers_bildung
## F = 10.6, num df = 4.00, denom df = 157.86, p-value = 1.239e-07
  1. Post-hoc-Tests
## # A tibble: 10 x 8
##    .y.          group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
##  * <chr>        <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
##  1 gleich_entf~ 1      2       -0.0121  -0.216     0.192    1.00e+0 ns          
##  2 gleich_entf~ 1      3       -0.0338  -0.235     0.168    9.87e-1 ns          
##  3 gleich_entf~ 1      4       -0.0598  -0.263     0.143    9.05e-1 ns          
##  4 gleich_entf~ 1      5       -0.125   -0.328     0.0772   3.81e-1 ns          
##  5 gleich_entf~ 2      3       -0.0217  -0.0746    0.0312   7.95e-1 ns          
##  6 gleich_entf~ 2      4       -0.0477  -0.108     0.0129   1.99e-1 ns          
##  7 gleich_entf~ 2      5       -0.113   -0.170    -0.0562   7.27e-7 ****        
##  8 gleich_entf~ 3      4       -0.0260  -0.0744    0.0224   5.84e-1 ns          
##  9 gleich_entf~ 3      5       -0.0914  -0.135    -0.0477   1.34e-7 ****        
## 10 gleich_entf~ 4      5       -0.0654  -0.118    -0.0126   7.00e-3 **

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Beruf (Einpersonenhaushalte)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    3   0.895 0.4429
##       3223
  1. Hypothesentests
##               Df Sum Sq Mean Sq F value   Pr(>F)    
## pers_beruf     3    8.3  2.7819   21.77 5.88e-14 ***
## Residuals   3223  411.8  0.1278                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 429 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_beruf 
## 
##   1       2       3      
## 2 0.61679 -       -      
## 3 0.00022 8.7e-10 -      
## 4 1.00000 0.24386 1.4e-07
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: Flexible Arbeitszeiten

Hat eine Person im Haushalt flexible Arbeitszeiten? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  0.0093 0.9231
##       10764
  1. Hypothesentests
##                        Df Sum Sq Mean Sq F value  Pr(>F)   
## max_pers_arbeitflex     1    1.2  1.2362   9.412 0.00216 **
## Residuals           10764 1413.8  0.1313                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 6304 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_arbeitflex 
## 
##   0     
## 1 0.0022
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.2218487
## # A tibble: 2 x 2
##   max_pers_arbeitflex  name
##   <fct>               <dbl>
## 1 0                   0.222
## 2 1                   0.222
## [1] 1.666667
## # A tibble: 2 x 2
##   max_pers_arbeitflex  name
##   <fct>               <dbl>
## 1 0                    1.67
## 2 1                    1.67

Unabhängige Variable: Flexible Arbeitszeiten (Einpersonenhaushalte)

Hat für die im Einpersonenhaushalt lebende Person flexible Arbeitszeiten? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value  Pr(>F)  
## group    1  4.8932 0.02711 *
##       1522                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by pers_arbeitflex
## t = 1.3414, df = 1429.1, p-value = 0.18
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.01125831  0.05995544
## sample estimates:
## mean in group 0 mean in group 1 
##       0.3041530       0.2798044
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1       -0.0243  -0.0600    0.0113  0.18 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_arbeitflex  name
##   <fct>           <dbl>
## 1 0               0.301
## 2 1               0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_arbeitflex  name
##   <fct>           <dbl>
## 1 0                   2
## 2 1                   2

Unabhängige Variable: Telearbeit

Ist Telearbeit für zumindest eine Person im Haushalt möglich? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  2.5336 0.1115
##       10706
  1. Hypothesentests
##                        Df Sum Sq Mean Sq F value   Pr(>F)    
## max_pers_arbeittele     1    4.2   4.184    31.9 1.66e-08 ***
## Residuals           10706 1404.1   0.131                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 6362 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_arbeittele 
## 
##   0      
## 1 1.7e-08
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.2218487
## # A tibble: 2 x 2
##   max_pers_arbeittele  name
##   <fct>               <dbl>
## 1 0                   0.222
## 2 1                   0.222
## [1] 1.666667
## # A tibble: 2 x 2
##   max_pers_arbeittele  name
##   <fct>               <dbl>
## 1 0                    1.67
## 2 1                    1.67

Unabhängige Variable: Telearbeit (Einpersonenhaushalte)

Ist Telearbeit für die im Einpersonenhaushalt lebende Person möglich? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  0.2503 0.6169
##       1515
  1. Hypothesentests
##                   Df Sum Sq Mean Sq F value Pr(>F)  
## pers_arbeittele    1   0.65  0.6493   5.216 0.0225 *
## Residuals       1515 188.61  0.1245                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 2139 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_arbeittele 
## 
##   0    
## 1 0.023
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_arbeittele  name
##   <fct>           <dbl>
## 1 0               0.301
## 2 1               0.222
## [1] 2
## # A tibble: 2 x 2
##   pers_arbeittele  name
##   <fct>           <dbl>
## 1 0                2   
## 2 1                1.67

Unabhängige Variable: PKW-Abstellplatz am Arbeitsplatz

Hat zumindest eine Person aus dem Haushalt eine PKW-Abstellmöglichkeit am Arbeitsplatz? - 1 … Nein - 2 … Unterschiedlich - 3 … Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     2  3.6643 0.02565 *
##       10762                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and max_pers_arbeit_parkpl
## F = 8.3891, num df = 2.00, denom df = 50.84, p-value = 0.0007104
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 1      2        0.158   0.00565   0.310   0.041 *           
## 2 gleich_entf_fakt~ 1      3       -0.0223 -0.0402   -0.00446 0.01  **          
## 3 gleich_entf_fakt~ 2      3       -0.180  -0.332    -0.0283  0.019 *

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.2218487
## # A tibble: 3 x 2
##   max_pers_arbeit_parkpl  name
##   <fct>                  <dbl>
## 1 1                      0.301
## 2 2                      0.458
## 3 3                      0.222
## [1] 1.666667
## # A tibble: 3 x 2
##   max_pers_arbeit_parkpl  name
##   <fct>                  <dbl>
## 1 1                       2   
## 2 2                       2.88
## 3 3                       1.67

Unabhängige Variable: Pkw-Abstellplatz am Arbeitsplatz (Einpersonenhaushalte)

Hat eine Person in einem Einpersonenhaushalt eine PKW-Abstellmöglichkeit am Arbeitsplatz? - 1 … Nein - 2 … Unterschiedlich - 3 … Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value   Pr(>F)   
## group    2   5.494 0.004194 **
##       1522                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and pers_arbeit_parkpl
## F = 1.379, num df = 2.000, denom df = 10.706, p-value = 0.2932
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 1      2        0.222   -0.344     0.787  0.427 ns          
## 2 gleich_entf_fakt~ 1      3       -0.0166  -0.0588    0.0255 0.625 ns          
## 3 gleich_entf_fakt~ 2      3       -0.238   -0.804     0.327  0.384 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 3 x 2
##   pers_arbeit_parkpl  name
##   <fct>              <dbl>
## 1 1                  0.301
## 2 2                  0.477
## 3 3                  0.301
## [1] 2
## # A tibble: 3 x 2
##   pers_arbeit_parkpl  name
##   <fct>              <dbl>
## 1 1                      2
## 2 2                      3
## 3 3                      2

Unabhängige Variable: Führerscheinbesitz Moped/Motorrad

Hat zumindest eine Person aus dem Haushalt einen Führerschein für Moped oder Motorrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1   1.335 0.2479
##       16285
  1. Hypothesentests
##                     Df Sum Sq Mean Sq F value   Pr(>F)    
## max_pers_fs_krad     1    4.6   4.570   34.36 4.66e-09 ***
## Residuals        16285 2165.7   0.133                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 783 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_fs_krad 
## 
##   0      
## 1 4.7e-09
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_fs_krad  name
##   <fct>            <dbl>
## 1 0                0.301
## 2 1                0.222
## [1] 2
## # A tibble: 2 x 2
##   max_pers_fs_krad  name
##   <fct>            <dbl>
## 1 0                 2   
## 2 1                 1.67

Unabhängige Variable: Führerscheinbesitz Moped/Motorrad (Einpersonenhaushalte)

Hat eine in einem Einpersonenhaushalt wohnende Person einen Führerschein für Moped oder Motorrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value  Pr(>F)  
## group    1  3.5201 0.06072 .
##       3179                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
##                Df Sum Sq Mean Sq F value Pr(>F)  
## pers_fs_krad    1    0.6  0.6011   4.621 0.0317 *
## Residuals    3179  413.5  0.1301                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 475 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fs_krad 
## 
##   0    
## 1 0.032
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_fs_krad  name
##   <fct>        <dbl>
## 1 0            0.301
## 2 1            0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_fs_krad  name
##   <fct>        <dbl>
## 1 0                2
## 2 1                2

Unabhängige Variable: Führerscheinbesitz PKW

Hat zumindest eine Person aus dem Haushalt einen PKW-Führerschein? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  1.1982 0.2737
##       16283
  1. Hypothesentests
##                    Df Sum Sq Mean Sq F value   Pr(>F)    
## max_pers_fs_pkw     1    1.9  1.8524   13.92 0.000192 ***
## Residuals       16283 2167.5  0.1331                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 785 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_fs_pkw 
## 
##   0      
## 1 0.00019
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_fs_pkw  name
##   <fct>           <dbl>
## 1 0               0.301
## 2 1               0.273
## [1] 2
## # A tibble: 2 x 2
##   max_pers_fs_pkw  name
##   <fct>           <dbl>
## 1 0                2   
## 2 1                1.88

Unabhängige Variable: Führerscheinbesitz PKW (Einpersonenhaushalte)

Hat zumindest eine Person aus dem Haushalt einen PKW-Führerschein? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  1.8966 0.1686
##       3178
  1. Hypothesentests
##               Df Sum Sq Mean Sq F value Pr(>F)  
## pers_fs_pkw    1    0.6  0.5877   4.523 0.0335 *
## Residuals   3178  413.0  0.1300                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 476 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fs_pkw 
## 
##   0    
## 1 0.034
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_fs_pkw  name
##   <fct>       <dbl>
## 1 0           0.398
## 2 1           0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_fs_pkw  name
##   <fct>       <dbl>
## 1 0             2.5
## 2 1             2

Unabhängige Variable: Fahrzeugverfügbarkeit Fahrrad

Hat zumindest eine Person aus dem Haushalt ein Fahrrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     1   3.971 0.04631 *
##       14769                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by max_pers_fahrrad
## t = 7.119, df = 4050.8, p-value = 1.28e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.04041555 0.07113642
## sample estimates:
## mean in group 0 mean in group 1 
##       0.3301436       0.2743676
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.           group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
## * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
## 1 gleich_entf_~ 0      1       -0.0558  -0.0711   -0.0404   2.81e-8 ****

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.2730013
## # A tibble: 2 x 2
##   max_pers_fahrrad  name
##   <fct>            <dbl>
## 1 0                0.301
## 2 1                0.222
## [1] 1.875
## # A tibble: 2 x 2
##   max_pers_fahrrad  name
##   <fct>            <dbl>
## 1 0                 2   
## 2 1                 1.67

Unabhängige Variable: Fahrzeugverfügbarkeit Fahrrad (Einpersonenhaushalt)

Hat zumindest eine Person aus dem Haushalt ein Fahrrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  0.7691 0.3806
##       2824
  1. Hypothesentests
##                Df Sum Sq Mean Sq F value   Pr(>F)    
## pers_fahrrad    1    1.8  1.7867   13.97 0.000189 ***
## Residuals    2824  361.1  0.1279                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 830 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fahrrad 
## 
##   0      
## 1 0.00019
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_fahrrad  name
##   <fct>        <dbl>
## 1 0            0.301
## 2 1            0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_fahrrad  name
##   <fct>        <dbl>
## 1 0                2
## 2 1                2

Unabhängige Variable: Fahrzeugverfügbarkeit Moped/Motorrad

Hat zumindest eine Person aus dem Haushalt ein Moped/Motorrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  0.6239 0.4296
##       7704
  1. Hypothesentests
##                 Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_krad    1    0.1 0.06189   0.453  0.501
## Residuals     7704 1052.6 0.13663               
## 9364 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_krad 
## 
##   0  
## 1 0.5
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.2218487
## # A tibble: 2 x 2
##   max_pers_krad  name
##   <fct>         <dbl>
## 1 0             0.222
## 2 1             0.222
## [1] 1.666667
## # A tibble: 2 x 2
##   max_pers_krad  name
##   <fct>         <dbl>
## 1 0              1.67
## 2 1              1.67

Unabhängige Variable: Fahrzeugverfügbarkeit Moped/Motorrad (Einpersonenhaushalte)

Hat zumindest eine Person aus dem Haushalt ein Moped/Motorrad? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##        Df F value Pr(>F)
## group   1  0.5096 0.4755
##       871
  1. Hypothesentests
##              Df Sum Sq Mean Sq F value Pr(>F)
## pers_krad     1   0.02 0.02227   0.151  0.698
## Residuals   871 128.60 0.14765               
## 2783 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_krad 
## 
##   0  
## 1 0.7
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_krad  name
##   <fct>     <dbl>
## 1 0         0.301
## 2 1         0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_krad  name
##   <fct>     <dbl>
## 1 0             2
## 2 1             2

Unabhängige Variable: Fahrzeugverfügbarkeit PKW

Hat zumindest eine Person aus dem Haushalt einen PKW zur Verfügung? - 1 … nie - 2 … gelegentlich - 3 … jederzeit

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     2  3.9497 0.01928 *
##       15794                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and max_pers_pkw
## F = 9.5778, num df = 2.0, denom df = 1843.2, p-value = 7.276e-05
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.            group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
## * <chr>          <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
## 1 gleich_entf_f~ 1      2       -0.0602 -9.32e-2   -0.0272  5.75e-5 ****        
## 2 gleich_entf_f~ 1      3       -0.0363 -6.04e-2   -0.0121  1.00e-3 ***         
## 3 gleich_entf_f~ 2      3        0.0239 -8.84e-4    0.0488  6.20e-2 ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 3 x 2
##   max_pers_pkw  name
##   <ord>        <dbl>
## 1 1            0.301
## 2 2            0.222
## 3 3            0.273
## [1] 2
## # A tibble: 3 x 2
##   max_pers_pkw  name
##   <ord>        <dbl>
## 1 1             2   
## 2 2             1.67
## 3 3             1.88

Unabhängige Variable: Fahrzeugverfügbarkeit PKW (Einpersonenhaushalte)

Hat zumindest eine Person aus dem Haushalt einen PKW zur Verfügung? - 1 … nie - 2 … gelegentlich - 3 … jederzeit

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value  Pr(>F)  
## group    2  4.2996 0.01366 *
##       2967                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and pers_pkw
## F = 4.841, num df = 2.00, denom df = 697.67, p-value = 0.008167
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 1      2       -0.0711 -0.126    -0.0159  0.007 **          
## 2 gleich_entf_fakt~ 1      3       -0.0302 -0.0658    0.00528 0.113 ns          
## 3 gleich_entf_fakt~ 2      3        0.0409 -0.00974   0.0915  0.14  ns

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 3 x 2
##   pers_pkw  name
##   <ord>    <dbl>
## 1 1        0.368
## 2 2        0.301
## 3 3        0.301
## [1] 2
## # A tibble: 3 x 2
##   pers_pkw  name
##   <ord>    <dbl>
## 1 1         2.33
## 2 2         2   
## 3 3         2

Unabhängige Variable: ÖV-Zeitkartenbesitz (Wochen-/Monats-/Jahreskarte)

Hat zumindest eine Person aus dem Haushalt eine Wochen-, Monats- oder Jahreskarte für den öffentlichen Verkehr? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     1  30.755 2.973e-08 ***
##       16067                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by max_pers_oev_zeitkarte
## t = 5.0781, df = 11551, p-value = 3.872e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.01849363 0.04174689
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2993718       0.2692516
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.           group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
## * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
## 1 gleich_entf_~ 0      1       -0.0301  -0.0417   -0.0185   3.86e-7 ****

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_oev_zeitkarte  name
##   <fct>                  <dbl>
## 1 0                      0.301
## 2 1                      0.243
## [1] 2
## # A tibble: 2 x 2
##   max_pers_oev_zeitkarte  name
##   <fct>                  <dbl>
## 1 0                       2   
## 2 1                       1.75

Unabhängige Variable: ÖV-Zeitkartenbesitz (Wochen-/Monats-/Jahreskarte) (Einpersonenhaushalte)

Hat eine im Einpersonenhaushalt lebende Person eine Wochen-, Monats- oder Jahreskarte für den öffentlichen Verkehr? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value    Pr(>F)    
## group    1  15.973 6.574e-05 ***
##       3149                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by pers_oev_zeitkarte
## t = 2.6547, df = 1926.7, p-value = 0.008003
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.009224763 0.061396845
## sample estimates:
## mean in group 0 mean in group 1 
##       0.3337874       0.2984766
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1       -0.0353  -0.0614  -0.00922 0.008 **

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_oev_zeitkarte  name
##   <fct>              <dbl>
## 1 0                  0.301
## 2 1                  0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_oev_zeitkarte  name
##   <fct>              <dbl>
## 1 0                      2
## 2 1                      2

ÖV-Nutzungsfaktor nach ÖV-Zeitkartenbesitz

Auf Haushaltsebene: Besitzen alle Personen des Haushalts eine ÖV-Zeitkarte oder nur manche oder niemand? - 0 … niemand besitzt eine ÖV-Zeitkarte (ÖV-averser Haushalt) - 1 … mindestens eine Person im Haushalt, aber nicht jede besitzt eine ÖV-Zeitkarte (ÖV-gemischter Haushalt) - 2 … alle Personen im Haushalt besitzen eine ÖV-Zeitkarte (ÖV-affiner Haushalt)

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value   Pr(>F)    
## group     2  20.242 1.66e-09 ***
##       16066                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and nutz_oev_zeitkarte
## F = 15.182, num df = 2.0, denom df = 5088.2, p-value = 2.667e-07
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.           group1 group2 estimate conf.low conf.high     p.adj p.adj.signif
## * <chr>         <chr>  <chr>     <dbl>    <dbl>     <dbl>     <dbl> <chr>       
## 1 gleich_entf_~ 0      1       -0.0396 -5.67e-2  -0.0225    1.82e-7 ****        
## 2 gleich_entf_~ 0      2       -0.0172 -3.56e-2   0.00122   7.30e-2 ns          
## 3 gleich_entf_~ 1      2        0.0224  2.74e-4   0.0444    4.60e-2 *

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Unabhängige Variable: ÖV-Ermäßigungskarte (Vorteilscard)

Hat zumindest eine Person aus dem Haushalt eine Ermäßigung für den öffentlichen Verkehr? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value   Pr(>F)   
## group     1  6.7384 0.009445 **
##       16067                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by max_pers_oev_ermaessigung
## t = 2.6472, df = 8838.8, p-value = 0.008131
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.004292012 0.028786351
## sample estimates:
## mean in group 0 mean in group 1 
##       0.2940864       0.2775472
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1       -0.0165  -0.0288  -0.00429 0.008 **

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_oev_ermaessigung  name
##   <fct>                     <dbl>
## 1 0                         0.301
## 2 1                         0.301
## [1] 2
## # A tibble: 2 x 2
##   max_pers_oev_ermaessigung  name
##   <fct>                     <dbl>
## 1 0                             2
## 2 1                             2

Unabhängige Variable: ÖV-Ermäßigungskarte (Vorteilscard) (Einpersonenhaushalte)

Hat zumindest eine Person aus dem Haushalt eine Ermäßigung für den öffentlichen Verkehr? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  2.2377 0.1348
##       3149
  1. Hypothesentests
##                         Df Sum Sq Mean Sq F value Pr(>F)
## pers_oev_ermaessigung    1    0.0 0.00759   0.058  0.809
## Residuals             3149  409.9 0.13015               
## 505 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_oev_ermaessigung 
## 
##   0   
## 1 0.81
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_oev_ermaessigung  name
##   <fct>                 <dbl>
## 1 0                     0.301
## 2 1                     0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_oev_ermaessigung  name
##   <fct>                 <dbl>
## 1 0                         2
## 2 1                         2

Unabhängige Variable: Elektronische Navigation Pkw

Verwendet zumindest eine Person aus dem Haushalt beim Autofahren ein Navigationssystem? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  0.8292 0.3625
##       16152
  1. Hypothesentests
##                      Df Sum Sq Mean Sq F value Pr(>F)    
## max_pers_navi_pkw     1   11.2  11.189   84.46 <2e-16 ***
## Residuals         16152 2139.7   0.132                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 916 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_navi_pkw 
## 
##   0     
## 1 <2e-16
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_navi_pkw  name
##   <fct>             <dbl>
## 1 0                 0.301
## 2 1                 0.222
## [1] 2
## # A tibble: 2 x 2
##   max_pers_navi_pkw  name
##   <fct>             <dbl>
## 1 0                  2   
## 2 1                  1.67

Unabhängige Variable: Elektronische Navigation PKW (Einpersonenhaushalte)

Verwendet zumindest eine Person aus dem Haushalt beim Autofahren ein Navigationssystem? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  0.5345 0.4648
##       3156
  1. Hypothesentests
##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## pers_navi_pkw    1    2.4  2.4489   18.97 1.37e-05 ***
## Residuals     3156  407.5  0.1291                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_navi_pkw 
## 
##   0      
## 1 1.4e-05
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_navi_pkw  name
##   <fct>         <dbl>
## 1 0             0.301
## 2 1             0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_navi_pkw  name
##   <fct>         <dbl>
## 1 0                 2
## 2 1                 2

Unabhängige Variable: Elektronische Navigation ÖV

Verwendet zumindest eine Person aus dem Haushalt für die Benutzung des öffentlichen Verkehrs ein Navigationssystem? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     1  14.048 0.0001788 ***
##       16157                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  Welch Two Sample t-test
## 
## data:  gleich_entf_fakt_lg by max_pers_navi_oev
## t = 8.9499, df = 11900, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.04139448 0.06461149
## sample estimates:
## mean in group 0 mean in group 1 
##       0.3072542       0.2542512
  1. Post-hoc-Tests
## # A tibble: 1 x 8
##   .y.               group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr>             <chr>  <chr>     <dbl>    <dbl>     <dbl> <dbl> <chr>       
## 1 gleich_entf_fakt~ 0      1       -0.0530  -0.0646   -0.0414     0 ****

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_navi_oev  name
##   <fct>             <dbl>
## 1 0                 0.301
## 2 1                 0.222
## [1] 2
## # A tibble: 2 x 2
##   max_pers_navi_oev  name
##   <fct>             <dbl>
## 1 0                  2   
## 2 1                  1.67

Unabhängige Variable: Elektronische Navigation ÖV (Einpersonenhaushalte)

Verwendet zumindest eine Person aus dem Haushalt für die Benutzung des öffentlichen Verkehrs ein Navigationssystem? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1    1.65 0.1991
##       3156
  1. Hypothesentests
##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## pers_navi_oev    1    1.7  1.7058   13.19 0.000286 ***
## Residuals     3156  408.2  0.1293                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_navi_oev 
## 
##   0      
## 1 0.00029
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_navi_oev  name
##   <fct>         <dbl>
## 1 0             0.301
## 2 1             0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_navi_oev  name
##   <fct>         <dbl>
## 1 0                 2
## 2 1                 2

Unabhängige Variable: Elektronische Navigation andere Gelegenheiten

Wird von zumindest einer Person aus dem Haushalt ein Navigationssystem zu einem anderen Zweck verwendet? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value  Pr(>F)  
## group     1  3.5867 0.05826 .
##       16157                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
##                         Df Sum Sq Mean Sq F value  Pr(>F)    
## max_pers_navi_andere     1      4   3.958   29.78 4.9e-08 ***
## Residuals            16157   2147   0.133                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 911 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_navi_andere 
## 
##   0      
## 1 4.9e-08
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_navi_andere  name
##   <fct>                <dbl>
## 1 0                    0.301
## 2 1                    0.222
## [1] 2
## # A tibble: 2 x 2
##   max_pers_navi_andere  name
##   <fct>                <dbl>
## 1 0                     2   
## 2 1                     1.67

Unabhängige Variable: Elektronische Navigation andere Gelegenheiten (Einpersonenhaushalte)

Wird von zumindest einer Person aus dem Haushalt ein Navigationssystem zu einem anderen Zweck verwendet? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  1.7931 0.1806
##       3156
  1. Hypothesentests
##                    Df Sum Sq Mean Sq F value Pr(>F)  
## pers_navi_andere    1    0.5  0.4986   3.843   0.05 .
## Residuals        3156  409.4  0.1297                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_navi_andere 
## 
##   0   
## 1 0.05
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_navi_andere  name
##   <fct>            <dbl>
## 1 0                0.301
## 2 1                0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_navi_andere  name
##   <fct>            <dbl>
## 1 0                    2
## 2 1                    2

Unabhängige Variable: Betreuung von Kindern

Betreut zumindest eine Person im Haushalt ein Kind? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  1.4795 0.2239
##       16113
  1. Hypothesentests
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## max_pers_betr_kind     1    3.1  3.0734   23.12 1.54e-06 ***
## Residuals          16113 2141.9  0.1329                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 955 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_kind 
## 
##   0      
## 1 1.5e-06
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_betr_kind  name
##   <fct>              <dbl>
## 1 0                  0.301
## 2 1                  0.222
## [1] 2
## # A tibble: 2 x 2
##   max_pers_betr_kind  name
##   <fct>              <dbl>
## 1 0                   2   
## 2 1                   1.67

Unabhängige Variable: Betreuung von Kindern (Einpersonenhaushalte)

Betreut zumindest eine Person im Haushalt ein Kind? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  0.0359 0.8497
##       3156
  1. Hypothesentests
##                  Df Sum Sq Mean Sq F value Pr(>F)  
## pers_betr_kind    1    0.4  0.4240   3.289 0.0698 .
## Residuals      3156  406.8  0.1289                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_kind 
## 
##   0   
## 1 0.07
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_betr_kind  name
##   <fct>          <dbl>
## 1 0              0.301
## 2 1              0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_betr_kind  name
##   <fct>          <dbl>
## 1 0                  2
## 2 1                  2

Unabhängige Variable: Betreuung von Verwandten

Betreut zumindest eine Person im Haushalt eine/n Verwandte/n? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  0.3438 0.5577
##       16113
  1. Hypothesentests
##                            Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_betr_verwandte     1      0 0.00371   0.028  0.867
## Residuals               16113   2145 0.13312               
## 955 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_verwandte 
## 
##   0   
## 1 0.87
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_betr_verwandte  name
##   <fct>                   <dbl>
## 1 0                       0.301
## 2 1                       0.270
## [1] 2
## # A tibble: 2 x 2
##   max_pers_betr_verwandte  name
##   <fct>                   <dbl>
## 1 0                        2   
## 2 1                        1.86

Unabhängige Variable: Betreuung von Verwandten (Einpersonenhaushalte)

Betreut zumindest eine Person im Haushalt eine/n Verwandte/n? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1  2.2937   0.13
##       3156
  1. Hypothesentests
##                       Df Sum Sq Mean Sq F value Pr(>F)
## pers_betr_verwandte    1    0.0 0.02216   0.172  0.679
## Residuals           3156  407.2 0.12904               
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_verwandte 
## 
##   0   
## 1 0.68
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_betr_verwandte  name
##   <fct>               <dbl>
## 1 0                   0.301
## 2 1                   0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_betr_verwandte  name
##   <fct>               <dbl>
## 1 0                       2
## 2 1                       2

Unabhängige Variable: Betreuung von anderen Personen

Betreut zumindest eine Person im Haushalt eine andere Person? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value Pr(>F)
## group     1  1.3143 0.2516
##       16113
  1. Hypothesentests
##                         Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_betr_andere     1    0.1  0.1214   0.912   0.34
## Residuals            16113 2144.9  0.1331               
## 955 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_andere 
## 
##   0   
## 1 0.34
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   max_pers_betr_andere  name
##   <fct>                <dbl>
## 1 0                    0.301
## 2 1                    0.301
## [1] 2
## # A tibble: 2 x 2
##   max_pers_betr_andere  name
##   <fct>                <dbl>
## 1 0                        2
## 2 1                        2

Unabhängige Variable: Betreuung von anderen Personen (Einpersonenhaushalte)

Betreut zumindest eine Person im Haushalt eine andere Person? Nein/Ja

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##         Df F value Pr(>F)
## group    1   0.024 0.8768
##       3156
  1. Hypothesentests
##                    Df Sum Sq Mean Sq F value Pr(>F)
## pers_betr_andere    1    0.3  0.3119   2.419   0.12
## Residuals        3156  407.0  0.1290               
## 498 observations deleted due to missingness
  1. Post-hoc-Tests
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_andere 
## 
##   0   
## 1 0.12
## 
## P value adjustment method: bonferroni

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Berechnen des Medians

## [1] 0.30103
## # A tibble: 2 x 2
##   pers_betr_andere  name
##   <fct>            <dbl>
## 1 0                0.301
## 2 1                0.301
## [1] 2
## # A tibble: 2 x 2
##   pers_betr_andere  name
##   <fct>            <dbl>
## 1 0                    2
## 2 1                    2

Einlesen des Wegedatensatzes von ÖU 2013/2014

##  [1] "hh_nr"                                 
##  [2] "pers_nr"                               
##  [3] "perstag_stnr"                          
##  [4] "hh_wohnbdl"                            
##  [5] "hh_wohnraumtyp"                        
##  [6] "perstag_jahr"                          
##  [7] "perstag_jzeit"                         
##  [8] "perstag_tag"                           
##  [9] "perstag_wttyp"                         
## [10] "weg_nr"                                
## [11] "weg_startzeit"                         
## [12] "weg_startgemeinde"                     
## [13] "weg_startbezirk"                       
## [14] "weg_startbdl"                          
## [15] "weg_startraumtyp"                      
## [16] "weg_startland"                         
## [17] "weg_quellzweck"                        
## [18] "weg_zielzweck"                         
## [19] "weg_zweck"                             
## [20] "weg_vm_fuss"                           
## [21] "weg_vm_rad"                            
## [22] "weg_vm_pkwlenk"                        
## [23] "weg_vm_pkwmit"                         
## [24] "weg_vm_krad"                           
## [25] "weg_vm_bus"                            
## [26] "weg_vm_strab"                          
## [27] "weg_vm_bahn"                           
## [28] "weg_vm_flug"                           
## [29] "weg_vm_schiff"                         
## [30] "weg_vm_taxi"                           
## [31] "weg_vm_fernz"                          
## [32] "weg_vm_reisebus"                       
## [33] "weg_vm_anderes"                        
## [34] "weg_vm_haupt"                          
## [35] "weg_vm_haupt_kl"                       
## [36] "weg_zielzeit"                          
## [37] "weg_zielgemeinde"                      
## [38] "weg_zielbezirk"                        
## [39] "weg_zielbdl"                           
## [40] "weg_zielraumtyp"                       
## [41] "weg_zielland"                          
## [42] "weg_dauer"                             
## [43] "weg_dauer_kat"                         
## [44] "weg_laenge"                            
## [45] "weg_laenge_kat"                        
## [46] "weg_hochrechnungsfaktor_woche"         
## [47] "weg_hochrechnungsfaktor_werktag"       
## [48] "weg_hochrechnungsfaktor_samstag"       
## [49] "weg_hochrechnungsfaktor_sonntag"       
## [50] "weg_hochrechnungsfaktor_herbst_werktag"

Datenaufbereitung

Zwecks Vereinfachung fürs Rechnen werden alle negativen Werte (nicht anwendbar oder keine Angabe) zu NA umgerechnet, da R fehlende Werte in vielen Fällen automatisch bei Rechnungen ignoriert.

Es wird eine neue Spalte eingefügt, die Auskunft darüber gibt, ob der ÖV das Hauptverkehrsmittel am Weg war oder nicht. (Ja = 1, Nein = 0)

Es wird nun umgerechnet, ob alle, manche oder gar keine Wege innerhalb eines Haushaltes mit dem ÖV zurückgelegt wurden. Dies wird über die Berechnung des Durchschnitts der zuvor neu eingeführten Variable ermittelt.

0 = gar keine 0 < x < 1 = manche 1 = alle

## `summarise()` ungrouping output (override with `.groups` argument)

Dies wird nun dem großen Datensatz angefügt. Zuerst werden aber folgende neue Kategorien gebildet: 1 … gar keine (vormals 0) 2 … gemischt (0 < x < 1) 3 … alle (vormals 1)

##  [1] "hh_nr"                     "hst_gehdauer"             
##  [3] "hst_gehlaenge"             "hst_vm"                   
##  [5] "hst_ubahn"                 "hst_tram"                 
##  [7] "hst_lokbus"                "hst_regbus"               
##  [9] "hst_type"                  "hst_kategorie"            
## [11] "hst_gehdauer_kat"          "hst_bus"                  
## [13] "hst_bahn"                  "hh_wohnbdl"               
## [15] "hh_wohnraumtyp"            "hh_wohnbezirk"            
## [17] "hh_wohngemeinde"           "hh_gr"                    
## [19] "hh_gru6"                   "hh_gr617"                 
## [21] "hh_grue18"                 "hgr_kat"                  
## [23] "hh_oev_entf"               "hh_oev_entf_kat"          
## [25] "hh_oev_bus"                "hh_oev_strb"              
## [27] "hh_oev_ubahn"              "hh_oev_bahn"              
## [29] "hh_carsharing"             "hh_wirtschsituation"      
## [31] "fzg_radges"                "fzg_e_rad"                
## [33] "fzg_mot"                   "fzg_pkw"                  
## [35] "hh_hochrechnungsfaktor"    "hh_kobasis"               
## [37] "hh_öv_güte"                "hh_oev_entf_kat_neu"      
## [39] "GKZ_neu"                   "GEMNAME"                  
## [41] "UR_TYP"                    "POP_2015"                 
## [43] "seit"                      "gemname_alt"              
## [45] "hst_zug"                   "gleich_entf_fakt"         
## [47] "gleich_entf_fakt_lg"       "gleich_entf_kat"          
## [49] "hst_gehlaenge_kat"         "mean_pers_alter"          
## [51] "max_pers_bildung"          "mean_pers_arbeitsstd"     
## [53] "max_pers_arbeitflex"       "max_pers_arbeittele"      
## [55] "max_pers_arbeit_parkpl"    "max_pers_fs_krad"         
## [57] "max_pers_fs_pkw"           "max_pers_fahrrad"         
## [59] "max_pers_krad"             "max_pers_pkw"             
## [61] "max_pers_oev_zeitkarte"    "max_pers_oev_ermaessigung"
## [63] "max_pers_navi_pkw"         "max_pers_navi_oev"        
## [65] "max_pers_navi_andere"      "max_pers_betr_kind"       
## [67] "max_pers_betr_verwandte"   "max_pers_betr_andere"     
## [69] "nutz_oev_zeitkarte"        "mean_pers_alter_kat"      
## [71] "mean_hh_oev_haupt"         "mean_hh_oev_haupt_kat"

Unabhängige Variable: ÖV-Nutzung laut Wegetagebuch

Es gibt drei Kategorien, die aus den Einträgen im Wegetagebuch ergaben: 1 … es wurden gar keine Wege während des Beobachtungszeitraum mit dem ÖV zurückgelegt 2 … es wurden manche Wege mit dem ÖV zurückgelegt, aber nicht alle 3 … alle Personen im Haushalt haben alle ihre Wege mit dem ÖV zurückgelegt.

Hypothesentest

  1. Bilden von Subsets und Histogrammen für jede Gruppe, um auf Normalverteilung zu prüfen

  1. Testen der Varianzhomogenität
## Levene's Test for Homogeneity of Variance (center = median)
##          Df F value    Pr(>F)    
## group     2  13.804 1.024e-06 ***
##       15428                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hypothesentests
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  gleich_entf_fakt_lg and mean_hh_oev_haupt_kat
## F = 17.088, num df = 2.0, denom df = 1426.9, p-value = 4.638e-08
  1. Post-hoc-Tests
## # A tibble: 3 x 8
##   .y.            group1 group2 estimate conf.low conf.high    p.adj p.adj.signif
## * <chr>          <chr>  <chr>     <dbl>    <dbl>     <dbl>    <dbl> <chr>       
## 1 gleich_entf_f~ 1      2       -0.0312 -0.0456    -0.0168  1.17e-6 ****        
## 2 gleich_entf_f~ 1      3        0.0329 -0.00364    0.0695  8.70e-2 ns          
## 3 gleich_entf_f~ 2      3        0.0641  0.0269     0.101   1.75e-4 ***

Graphische Darstellung

## `summarise()` ungrouping output (override with `.groups` argument)

Alterspyramide ÖU 2013/2014

Zunächst werden die entsprechenden Alterskategorien gebildet.

Nun wird die Alterspyramide erstellt.